JOPSS:検索結果一覧

検索結果：　3 件中 1件目～3件目を表示

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

論文

High performance LOBPCG method for solving multiple eigenvalues of Hubbard model; Efficiency of communication avoiding Neumann expansion preconditioner

山田進; 今村俊幸*; 町田昌彦

Lecture Notes in Computer Science 10776, p.243 - 256, 2018/00

https://doi.org/10.1007/978-3-319-69953-0_14

被引用回数：0 パーセンタイル：0.01(Computer Science, Artificial Intelligence)

本発表は科学研究費補助金(科研費)研究の一環として実施した量子問題計算に現れる大規模な対称疎行列であるハミルトニアン行列の複数の固有値および固有ベクトルを計算する際に用いる省通信ノイマン展開前処理の有効性についての報告である。具体的な成果は、ハミルトニアン行列の複数の固有値とそれに対応する固有ベクトルをLOBPCG法を用いて反復計算する際の収束性を向上させるための新規の前処理方法を提案し、実際の計算から既存の方法よりも短時間で計算できることを示したことである。さらに、問題の物理的性質を利用して前処理計算の通信回数を減少させるアルゴリズムを提案し、原子力機構のスパコンSGI ICEXおよび理化学研究所の京スパコンの数千コアを用いた並列計算において、高速化が実現することを確認した。この成果は、量子計算の高速計算だけでなく、今後大規模化していく並列計算機の有効利用に資する成果でもある。

論文

Application of a preconditioned Chebyshev basis communication-avoiding conjugate gradient method to a multiphase thermal-hydraulic CFD code

井戸村泰宏; 伊奈拓也*; 真弓明恵; 山田進; 今村俊幸*

Lecture Notes in Computer Science 10776, p.257 - 273, 2018/00

https://doi.org/10.1007/978-3-319-69953-0_15

被引用回数：2 パーセンタイル：50.36(Computer Science, Artificial Intelligence)

前処理付チェビシェフ基底省通信共役勾配(P-CBCG)法を多相熱流体CFDコードJUPITERにおける圧力ポアソン方程式に適用し、8,208台のKNLプロセッサを搭載したOakforest-PACS上で計算性能と収束特性を前処理付共役勾配(P-CG)法や前処理付省通信共役勾配(P-CACG)法と比較した。P-CBCG法は収束特性のロバースト性を維持しつつ集団通信回数を削減する。このロバースト性向上により、P-CACG法と比べて一桁以上大きい省通信ステップ数を実現する。2,000プロセッサを用いた場合、P-CBCG法はP-CG法, P-CACG法と比べてそれぞれ1.38倍, 1.17倍高速であることを示した。

論文

Acceleration of wind simulation using locally mesh-refined Lattice Boltzmann Method on GPU-Rich supercomputers

小野寺直幸; 井戸村泰宏

Lecture Notes in Computer Science 10776, p.128 - 145, 2018/00

https://doi.org/10.1007/978-3-319-69953-0_8

被引用回数：10 パーセンタイル：85.87(Computer Science, Artificial Intelligence)

本研究では、局所細分化格子を適用した格子ボルツマン法を開発した。計算コードは、東京工業大学のGPUベースのスーパーコンピュータTSUBAME3.0を用いて開発を行い、最新のPascalアーキテクチャに対して最適化を行なった。1から36ノードを用いた弱スケーリングの性能測定では、NVIDIA TESLA P100を用いたGPU計算がBroadwellによるCPU計算の10倍以上の高速化が達成された。